L'analyse relationnelle pour la fouille de grandes bases de données
نویسندگان
چکیده
Résumé. Dans cet article nous montrerons, brièvement, les possibilités offertes par la théorie de l'analyse relationnelle, initiée dans les années 1980 à IBMCorp. Nous nous concentrerons sur les avancées théoriques et méthodologiques obtenues grâce à cette théorie pour fusionner l'information et pour traiter et analyser de grandes quantités de données qu'elles soient de type structuré ou non structuré. Nous aborderons brièvement la théorie de la similarité régularisée, théorie basée sur l'analyse relationnelle et la généralisant mais plus récente. Nous montrerons aussi des formules de transfert permettant d'exprimer des problèmes combinatoires bien connus sous forme de fonctions économiques linéaires appropriées pour différents type de problématique (tels que des problèmes de classification automatique ou des problèmes d'association,). Ceci en plus de la complexité linéaire O(N) de l’algorithmique sous jacente qui permet à cette approche d’être tout à fait convenable pour différentes applications réelles.
منابع مشابه
L'analyse relationnelle de concepts pour la fouille de données temporelles - Application à l'étude de données hydroécologiques
Résumé. Cet article présente une méthode d’exploration de données temporelles, fondée sur l’analyse relationnelle de concepts (ARC) et appliquée à des données séquentielles construites à partir d’échantillons physico-chimiques et biologiques prélevés dans des cours d’eau. Notre but est de mettre au jour des sous-séquences pertinentes et hiérarchisées, associant les deux types de paramètres. Pou...
متن کاملKhiops: outil d'apprentissage supervisé automatique pour la fouille de grandes bases de données multi-tables
Résumé. Khiops est un outil d’apprentissage supervisé automatique pour la fouille de grandes bases de données multi-tables. L’importance prédictive des variables est évaluée au moyen de modèles de discrétisation dans le cas numérique et de groupement de valeurs dans le cas catégoriel. Dans le cas d’une base multi-tables, par exemple des clients avec leurs achats, une table d’analyse individus ×...
متن کاملAnalyse d'information relationnelle par des graphes interactifs de grandes tailles
RESUME : La découverte de connaissances à partir d'importantes masses de données hétérogènes débouche le plus souvent sur l'analyse relationnelle. La recherche d'informations stratégiques s'appuie en effet sur les liens fonctionnels et sémantiques entre documents, acteurs, terminologie et concepts d'un domaine sans oublier le paramètre temps. De nombreuses méthodes sont proposées pour identifie...
متن کاملÉchantillonnage pour l'extraction de motifs séquentiels : des basesde données statiques aux flots de données
Résumé. Depuis quelques années, la communauté fouille de données s’est intéressée à la problématique de l’extraction de motifs séquentiels à partir de grandes bases de données en considérant comme hypothèse que les données pouvaient être chargées en mémoire centrale. Cependant, cette hypothèse est mise en défaut lorsque les bases manipulées sont trop volumineuses. Dans cet article, nous étudion...
متن کاملKhiops : outil de préparation et modélisation des données pour la fouille des grandes bases de données
Résumé. Khiops est un outil de préparation des données et de modélisation pour l’apprentissage supervisé et non supervisé. L’outil permet d’évaluer de façon non paramétrique la corrélation entre tous types de variables dans le cas non supervisé et l’importance prédictive des variables et paires de variables dans le cas de la classification supervisée. Ces évaluations sont effectuées au moyen de...
متن کامل